

Nové lokálne AI modely od OpenAI bežia najrýchlejšie na NVIDIA RTX
NVIDIA oznámila spoluprácu s OpenAI, nové modely gpt-oss si môžete naplno užiť na počítačoch s grafickými kartami GeForce RTX.
Spoločnosť OpenAI sprístupnila nové špičkové open-source AI modely gpt-oss, ktoré prinášajú výkon, ktorý bol donedávna dostupný len v cloudových dátových centrách. Vďaka novým modelom môžete tento AI výkon využívať aj lokálne, offline, priamo na vašich počítačoch.
Vďaka spolupráci medzi NVIDIA a OpenAI bežia nové modely najlepšie na počítačoch s grafickými kartami GeForce RTX. K dispozícii sú dve varianty modelov:
- gpt-oss-20b je navrhnutý pre AI počítače s aspoň 16 GB VRAM. Na grafickej karte GeForce RTX 5090 zvláda až 250 tokenov za sekundu
- gpt-oss-120b je určený pre profesionálne pracovné stanice s grafickými kartami RTX PRO
Oba modely boli trénované na výkonných grafických kartách NVIDIA H100 a ako prvé podporujú nový formát MXFP4, ktorý zlepšuje kvalitu a presnosť výstupu bez dopadu na výkon. Podporujú tiež rozsiahly kontext až 131 072 tokenov, čo je jedna z najvyšších hodnôt dostupných pre lokálne inferencovanie.
AI modely gpt-oss sú založené na modernej architektúre mixture-of-experts (MoE) a zvládajú pokročilé funkcie ako chain-of-thought, inštrukčné zadania či prácu s nástrojmi.
Ako používať modely gpt-oss lokálne na počítači
V rámci iniciatívy RTX AI Garage ukazuje NVIDIA niekoľko spôsobov, ako môžu vývojári a technologickí nadšenci začať využívať tieto nové modely:
- Aplikácia Ollama – najjednoduchší spôsob, ako si vyskúšať gpt-oss modely. Ponúka intuitívne rozhranie s optimalizáciou pre RTX GPU.
- Llama.cpp – NVIDIA spolupracuje s open-source komunitou na optimalizácii výkonu, vrátane podpory pre CUDA Graphs na zníženie latencie. Llama.cpp nájdete na GitHube.
- Microsoft AI Foundry – používatelia Windows môžu modely spustiť cez funkciu Microsoft AI Foundry Local, ktorá je aktuálne dostupná vo verejnom náhľade. Spustenie modelu prebieha cez jednoduchý príkaz: foundry model run gpt-oss-20b
Podrobné informácie o tom, ako začať používať modely gpt-oss na grafických kartách GeForce RTX, nájdete na blogu RTX AI Garage.
Zdroj: NVIDIA
Prečítajte si aj:
Podobné články

AI zadarmo alebo za stovky eur? Veľký prehľad ChatGPT, Gemini, Grok a Copilot

Umelá inteligencia v celej domácnosti zlepšuje život

Nová konkurencia pre ChatGPT? DuckDuckGo prichádza s vlastným AI balíkom

Lenovo predstavilo záplavu produktov pre využitie AI v praxi

ChatGPT s dohľadom: Pribudnú špeciálne účty pre deti
